查看原文
其他

观点分享 | 渊亭科技解决方案专家黄勇:MLOps实践DataExa-Insight中台及应用

9月28日,由中国人工智能产业发展联盟(以下简称“AIIA”或“联盟”)和中国信息通信研究院(以下简称“信通院”)联合举办了第二次“人工智能研发运营一体化(MLOps)技术沙龙”。沙龙以腾讯会议和小鹅通直播的方式召开,吸引了来自互联网、软件、通信、制造等多个行业近500名专家的关注和参与。会上渊亭科技解决方案专家黄勇分享了渊亭科技在MLOps方向的实践经验与思考。


以下为演讲实录:


一、关于MLOps


DevOps通过抽象、规范和连接应用程序生命周期的各项操作,体系化的提升开发、集成和交付效率。沿用DevOps的理念,结合机器学习的特点,行业正在探索适用于机器学习领域的最佳实践——MLOps:根据业务理解制定需求方案-准备数据产生相应数据特征-利用数据特征开发模型得到模型文件-持续优化训练直至发布服务-编排模型服务生成服务目录-形成能力工厂。


考虑机器学习生命周期的参与方,可以归纳一些典型的业务角色,MLOps实际是围绕这些角色的协同进行展开:负责标注数据的标注工程师、分析数据特征的数据分析师、基于脚本等进行研究的AI科学家、负责建模的算法工程师、参与资源调度和运维的AI工程师以及关注模型落地的业务分析师。

 


目前,机器学习的一些难点主要表现为以下几点:第一,数据处理量级越来越大;第二,多场景应用的可复用性;第三,大范围资源优化和效率提升;第四,AI人才短缺。而MLOps作为一套完整的AI技术实践方法论,助力高效全场景支撑,可以有效的解决以上痛点。和常规的机器学习开发不同,MLOps形成的需求-开发-部署-反馈闭环可以持续迭代,帮助模型持续优化。


 


二、MLOps产品实践


结合以上思考,渊亭科技梳理了MLOps的落地要点:构建帮助沉淀现有模型的模型仓库-模型开发过程中的资源管理和建模管理-数据挖掘过程中的可视化建模和数据探索-模型服务发布后的发布管理和建模工厂-负责多角色协作的运营中心和资源隔离-智慧中台建设所需的业务中心和知识中心。



基于这些思考,渊亭科技设计了DataExa-Insight中台产品。DataExa-Insight中台以管理中心、资源中心、运营中心为底层支撑,支撑数据中心、服务中心和模型中心这些关键能力。数据中心负责数据从标注到使用的全过程;服务中心承载AI核心能力,包含了AutoML、应用市场、模型发布等内容;模型中心处理模型生命周期的管理工作。


在这些服务的支持下,DataExa-Insight中台在数据准备、模型开发、模型训练、模型服务、服务目录等多个环节中,发挥其重要价值。

 

MLOps实践过程中,渊亭在如下几个方向上进行了关键设计:


01数据治理能力集成



数据的数量和质量决定了模型的质量,海量异构数据需要数据中台的能力支撑。在解决和自有/第三方数据中台快速集成上,DataExa-Insight做了一些重要的能力建设,例如:


1、支持20+种异构数据源之间的相互数据同步,无需用户实现复杂的编程,可按需加载插件;

2、支持数据的批量(离线)同步和增量同步等多种同步方式;

3、将数据集成与大数据开发能力有机结合,支持调度&监控告警;

4、提供可视化、统一化的数据配置;

5、基于数据质量追踪和血缘分析能力,能够有效评估数据质量。


DataExa-Insight中台-标注平台


02流程自动化



流程自动化是MLOps的核心之一。DataExa-Insight中台采用合理的自动化流程设定,有效降低人工智能的应用门槛,提升应用和模型迭代效率。



03模型完善和应用机制


模型的可复用、可迭代,是MLOps的另一个关键。DataExa-Insight中台从多个层面入手,致力于建成一个具有滚动的、增长的、变化的自学习能力AI中台。


DataExa-Insight中台的领域通用模型由模型代码、通用模型、学习模版三部分来组成,基于领域进行合理的分拆;基于应用市场让模型更容易变现,通过向导式的领域应用,有机结合既有的组成部分(数据、模型、模板等),快速输出模型能力,可供业务自行使用。

 

DataExa-Insight中台-领域应用模型


04应用构建傻瓜化


DataExa-Insight中台采用以下举措,构建完备的应用构建和使用机制,更有益于MLOps平台发挥价值:


1、应用支撑工具集成:将分析工具、挖掘工具、清洗工具等集成到应用开发工作台,提高使用效率;


2、应用生命周期管理:将应用开发、应用复制、应用使用、应用评价、应用分享等能力,集中管理和使用;


3、应用开发:DataExa-Insight中台提供多样化的应用开发能力支持,可以使用系统提供的内嵌开发工具进行可视化/脚本化开发,也可以引入独立开发的插件包。


DataExa-Insight中台-范例一览


05云化理念的MLOps



如何广泛使用云化技术,构建MLOps能力的弹性,向云原生演进?渊亭科技DataExa-Insight中台给出的答案是:


1、云基础设施标准化:基于容器技术的Runtime,标准化地使用IaaS层能力;


2、微服务化:提升业务组件的可扩展性,约束单服务的复杂性,并在微服务划分考虑数据和计算的使用特点,减少数据的搬运;


3、业务能力服务化:基于API-Gateway的服务提供能力,规约化、版本化、可控的提供MLOps特性。

技术栈


三、MLOps应用案例


最后,黄勇还分享了一个实际的落地案例。该案例基于DataExa-Insight产品能力,集中解决了某大型国有企业内部各个项目的AI应用需求,帮助解决了研发环节复杂、数据访问渠道不一、数据驱动力不足、管理分散、缺少资源沉淀、缺乏反馈与更新机制等问题。


为实现AI服务能力对内、对外的标准化,为各业务场景提供端到端AI能力生产流程,实现AI能力持续孵化演进和快速业务应用,渊亭科技汇聚多来源AI能力和资源,构建了统一的资源池,实现资源共享、提供一站式管理能力,助力AI能力开发和应用,为企业降本增效提供支持。

案例概述


往期回顾
01

AIIA2021人工智能产业峰会将于11月在杭州举行

02

AIIA2021人工智能产业峰会可信AI分论坛 将于11月11日在杭举行

03

《AI芯片选型目录(2021年)》即将重磅发布!!!



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存